Farina in Natura¶

Relatório - Análise de dados operacionais - ano 2022¶

O método utilizado foi a análise de dados exploratória, o que significa que os dados do estabelecimento Farina in Natura, foram analisados de forma a nos dar informações referente aos acontecimentos passados.

O período analisado foi 01 fevereiro de 2022 a 31 de Outubro 2022

A primeira descoberta na análise foi uma divergência nos dados de vendas de itens e faturamento. Após uma análise dos valores, descobrimos que a falta de entrada dos dados causou essa divergência, isso foi observado na venda de croissants, pois o valor de venda era superior ao valor do item pela sua quantidade. O que isso sugere é a falta da informação referente ao recheio do croissant utilizado, comportamento não ideal, já que deixamos de saber quais são realmente as preferências do cliente no que diz respeito aos recheios.

Verificando divergência dos dados¶

Foi verificada uma diferença de R$ 31.659,20 entre o valor de venda do item e o preço unitário vezes a quantidade.

Observamos na tabela acima que o valor de venda nesses itens vendidos sempre é maior do que o valor unitário do item multiplicado por sua quantidade

Após essa análise inicial, realizamos a conversão dos dados brutos e a posterior limpeza das informações. Algumas variáveis que foram enviadas pelo cliente foram descartadas, pois apresentavam muita falta de dados. Outras, no entanto, foram omitidas por não estarem no escopo da análise.

Exploração dos Dados¶

Ranking dos produtos mais vendidos¶

Porcentual dos produtos mais vendidos

Algumas métricas importantes foram observadas¶

O número de diferentes itens vendido pela loja é: 212
A média de itens por venda é: 2.79 itens
O número médio de itens vendidos por período do dia é: 
  Período  Média
0   manhã   3.05
2   tarde   2.78
1   noite   2.66

Vendas por período do dia

Itens mais vendidos mês a mês

Quantidade de itens vendidos por dia ao longo do ano

Observamos no gráfico dois pontos que chamam atenção, como destacados no próprio gráfico. Por isso iremos realizar uma análise mais minuciosa.

Para termos uma noção de como o gráfico das vendas se apresentam, excluindo-se esses pontos destacados, segue o gráfico abaixo:

Investigando dados atipicos¶

Detalhamento das vendas no dia 23 Junho 2022

Observamos um pico nas vendas no período entre as 16 e 17 horas, o que nos leva a crer que foram lançadas vendas de diversos períodos no sistema, não apenas as vendas que pertencem ao período. Essa prática leva a distorções na análise das vendas, pois não podemos realmente mensurar de quanto foram as vendas de tais itens em seu tempo de realização, temos então que excluir as vendas de tal período para prosseguirmos nossa análise.

Mais informações relevantes¶

Vendas dias de semana (DDS) vs Final de semana (FDS)¶

Vendas dia de semana(DDS)¶

O menor número de vendas em um dia de semana foi: 
1
O maior número de vendas em um dia de semana foi: 
241
O número médio de vendas em um dia de semana é: 
75.81

Vendas final de semana (FDS)¶

O menor número de vendas em um dia de fim-de-semana foi: 
65
O  maior número de vendas em um dia fim-de-semana foi: 
227
O número médio de vendas em um dia fim-de-semana é: 
133.74

Número de itens médios vendidos por cada pedido¶

O número médio de itens vendidos por tipo de dia da semana é: 
  Tipo de dia  Média
1         FDS   2.84
0         DDS   2.65

Itens vendidos por tipo de dia¶

Número de itens vendidos por dia da semana¶

horario item_count
103 2022-05-18 241
99 2022-05-14 227
187 2022-08-28 226
106 2022-05-21 226
242 2022-10-23 224
100 2022-05-15 215
207 2022-09-17 197
200 2022-09-10 190
11 2022-02-13 186
180 2022-08-21 183
29 2022-03-05 176
107 2022-05-22 175
235 2022-10-16 172
173 2022-08-14 172
113 2022-05-28 169
98 2022-05-13 169
43 2022-03-19 164
193 2022-09-03 164
227 2022-10-08 161
194 2022-09-04 160
159 2022-07-31 157
17 2022-02-20 156
114 2022-05-29 154
179 2022-08-20 153
213 2022-09-24 151
172 2022-08-13 151
197 2022-09-07 151
121 2022-06-05 150
186 2022-08-27 149
230 2022-10-11 148
228 2022-10-09 146
37 2022-03-13 145
105 2022-05-20 141
112 2022-05-27 141
44 2022-03-20 140
165 2022-08-06 138
109 2022-05-24 136
111 2022-05-26 136
36 2022-03-12 135
247 2022-10-28 135
171 2022-08-12 134
220 2022-10-01 133
153 2022-07-09 133
208 2022-09-18 130
231 2022-10-12 130
164 2022-08-05 129
234 2022-10-15 128
30 2022-03-06 126
78 2022-04-23 126
214 2022-09-25 126
93 2022-05-08 123
128 2022-06-12 123
51 2022-03-27 121
140 2022-06-25 121
5 2022-02-06 121
101 2022-05-16 119
152 2022-07-08 118
221 2022-10-02 117
201 2022-09-11 117
241 2022-10-22 116
97 2022-05-12 116
76 2022-04-21 114
135 2022-06-19 114
41 2022-03-17 114
160 2022-08-01 113
202 2022-09-12 112
150 2022-07-06 112
4 2022-02-05 112
248 2022-10-29 112
55 2022-03-31 111
178 2022-08-19 111
196 2022-09-06 111
3 2022-02-04 110
166 2022-08-07 110
86 2022-05-01 110
154 2022-07-10 109
10 2022-02-12 108
104 2022-05-19 108
16 2022-02-19 107
102 2022-05-17 106
15 2022-02-18 106
21 2022-02-25 106
92 2022-05-07 105
69 2022-04-14 104
212 2022-09-23 103
149 2022-07-05 102
68 2022-04-13 102
50 2022-03-26 102
184 2022-08-25 101
219 2022-09-30 101
7 2022-02-09 101
215 2022-09-26 99
190 2022-08-31 98
72 2022-04-17 97
243 2022-10-24 97
108 2022-05-23 97
147 2022-07-03 97
96 2022-05-11 96
22 2022-02-26 96
40 2022-03-16 95
141 2022-06-26 95
249 2022-10-30 94
13 2022-02-16 93
192 2022-09-02 93
58 2022-04-03 93
223 2022-10-04 92
26 2022-03-02 92
95 2022-05-10 91
167 2022-08-08 91
24 2022-02-28 91
175 2022-08-16 90
244 2022-10-25 89
189 2022-08-30 89
63 2022-04-08 89
211 2022-09-22 88
8 2022-02-10 88
79 2022-04-24 88
1 2022-02-02 88
191 2022-09-01 87
9 2022-02-11 87
25 2022-03-01 87
199 2022-09-09 87
23 2022-02-27 86
237 2022-10-18 86
185 2022-08-26 85
233 2022-10-14 84
85 2022-04-30 84
218 2022-09-29 84
120 2022-06-04 84
46 2022-03-22 83
162 2022-08-03 83
161 2022-08-02 82
71 2022-04-16 81
19 2022-02-23 81
127 2022-06-11 81
2 2022-02-03 81
143 2022-06-28 81
236 2022-10-17 80
195 2022-09-05 79
91 2022-05-06 79
62 2022-04-07 79
64 2022-04-09 78
238 2022-10-19 78
12 2022-02-14 77
65 2022-04-10 77
32 2022-03-08 77
239 2022-10-20 76
216 2022-09-27 76
204 2022-09-14 76
18 2022-02-21 75
240 2022-10-21 75
163 2022-08-04 75
0 2022-02-01 74
77 2022-04-22 74
170 2022-08-11 74
27 2022-03-03 73
203 2022-09-13 73
94 2022-05-09 73
34 2022-03-10 73
45 2022-03-21 72
132 2022-06-16 71
134 2022-06-18 71
47 2022-03-23 70
181 2022-08-22 69
174 2022-08-15 69
169 2022-08-10 69
229 2022-10-10 68
205 2022-09-15 68
14 2022-02-17 68
168 2022-08-09 68
250 2022-10-31 67
131 2022-06-15 67
48 2022-03-24 67
39 2022-03-15 67
176 2022-08-17 66
245 2022-10-26 66
209 2022-09-20 65
57 2022-04-02 65
56 2022-04-01 65
54 2022-03-30 65
177 2022-08-18 65
155 2022-07-11 65
90 2022-05-05 65
122 2022-06-06 64
210 2022-09-21 64
80 2022-04-25 64
222 2022-10-03 64
144 2022-06-29 63
89 2022-05-04 62
151 2022-07-07 62
232 2022-10-13 62
130 2022-06-14 61
110 2022-05-25 61
224 2022-10-05 61
115 2022-05-30 61
52 2022-03-28 61
148 2022-07-04 61
6 2022-02-07 61
28 2022-03-04 60
20 2022-02-24 60
87 2022-05-02 59
125 2022-06-09 58
198 2022-09-08 58
139 2022-06-24 58
182 2022-08-23 57
82 2022-04-27 57
217 2022-09-28 56
137 2022-06-21 56
60 2022-04-05 56
225 2022-10-06 56
246 2022-10-27 55
81 2022-04-26 54
226 2022-10-07 53
206 2022-09-16 53
183 2022-08-24 53
188 2022-08-29 53
75 2022-04-20 52
116 2022-05-31 52
59 2022-04-04 51
33 2022-03-09 51
119 2022-06-03 51
126 2022-06-10 50
61 2022-04-06 49
129 2022-06-13 48
49 2022-03-25 48
42 2022-03-18 48
145 2022-06-30 46
123 2022-06-07 45
53 2022-03-29 43
84 2022-04-29 42
142 2022-06-27 42
83 2022-04-28 41
117 2022-06-01 40
66 2022-04-11 40
74 2022-04-19 40
38 2022-03-14 39
88 2022-05-03 39
31 2022-03-07 38
73 2022-04-18 38
133 2022-06-17 38
35 2022-03-11 37
124 2022-06-08 35
67 2022-04-12 35
138 2022-06-22 32
136 2022-06-20 32
118 2022-06-02 30
70 2022-04-15 19
156 2022-07-12 10
146 2022-07-01 8
157 2022-07-26 2
158 2022-07-29 1

O gráfico abaixo representa um ranking das vendas por dia.

Utilizando-se um algoritmo podemos inferir que as vendas podem ser dividias em quartis e que o Farina in Natura apresenta a seguinte distribuição:

as 25% finais do Ranking são dias que tem vendas até 62,25 de itens vendidos, os 50% inferiores do ranking tem dias que vendem até 84 itens, sendo esse valor também a mediana, os 75% dos da parte de baixo do ranking vendem até 114 itens, e os 25% do topo dos dias temos vendas de até 190 itens.

Valores acima desses são considerados outliers, ou fora da curva.

Distribuição de vendas por hora do dia¶

A seguir temos um gráfico de distribuição das vendas por hora do dia, que segue a seguinte lógica, 25% das primeiras vendas se dá das 6 às 11 da manhã, os próximos 25% das vendas acontece entre 11 e 16 horas, o terceiro quarto das vendas ocorre entre as 16 e 18 horas, e os últimos 25% das vendas do dia se dá das 18 as 21 horas.

Itens vendidos por dia da semana

Distribuição de vendas por dia da semana e hora do dia¶

Detalhamento do porcentual das vendas pelo periodo do dia¶

Observamos por esse gráfico que os períodos iniciais e finais do dia são de pouco movimento portanto seria bom rever o horário de abertura e fechamento da loja.

Quantidade de itens vendidos por dia da semana e período¶

Vemos uma clara diferenciação entre o final de semana e os dias da semana: durante a semana, quase os dobros da venda a noite em relação a manhã e tarde. No sábado vemos um aumento significativo das vendas, principalmente pela manhã, que chega bem perto do período noturno. Já no Domingo há uma inversão completa, o período da manhã é o que apresenta a maior quantidade de vendas, apesar de termos um acréscimo do período da noite em relação aos dias de semana.

Analise das vendas, combinação dos itens na preferência do cliente

Para finalizarmos nossa análise, utilizaremos o algoritmo Apriori.

Queremos aumentar o número de itens vendidos de uma maneira que incentive itens que, caso contrário, não seriam comprados. Devemos levar em conta as variáveis que sabemos que alteram a forma como os clientes interagem conosco (ou seja, hora do dia e dia da semana). O resultado final deve fornecer uma direção clara sobre como agir, por que esse curso de ação é desejável e não deve ser muito confuso para o cliente nem muito complexo para um operador.

A compra de qual item leva à compra de quais outros itens? O algoritmo “Apriori” é capaz de responder isso.

Apriori Algorithm¶

O algoritmo “Apriori” nos ajudará a fazer a combinação de itens a serem vendidos em conjunto. Utilizamos a métrica do SUPORTE para acharmos os itens que são mais vendidos. O SUPORTE é calculado dividindo a quantidade de itens vendidos de um determinado produto pela quantidade de todos os itens vendidos. Por exemplo no caso da Farina In Natura, o item que possui o maior SUPORTE é o croissant(0,2063). O algoritmo fara uma combinação dos itens que tem maior SUPORTE com os de menor SUPORTE. Para isso utilizará as métrica da CONFIANÇA e INCREMENTO.

A CONFIANÇA nos dá a probabilidade de o consequente estar presente em uma transação, dado que o antecedente já está presente. Os valores de confiança variam entre 0 e 1. Um valor de confiança próximo a 1 sugere uma forte relação entre antecedente e consequente, enquanto um valor próximo a 0 indica uma relação fraca.

A métrica INCREMENTO é uma medida usada para avaliar a qualidade das regras de associação geradas pelo algoritmo “Apriori”. Ela ajuda a determinar se a relação entre o antecedente e o consequente em uma regra Antecedente->Consequente é significativa ou se ocorre apenas por acaso. Métricas de INCREMENTO maior que 1, nos dizem que antecedentes e consequentes ocorrem juntos mais frequentemente do que esperaríamos se fossem estatisticamente independentes. Ou seja quanto maior o valor do INCREMENTO maior a dependência deles

Na tabela abaixo vemos combinações de itens propostas pelo algoritmo com base nessas métricas e na ordem de decrescente da métrica Incremento.

antecedents consequents antecedent support consequent support support confidence lift leverage conviction
0 ADICIONAL DE MUSSARELA, ADICIONAL DE PRESUNTO CROISSANT 0.006107 0.206342 0.005637 0.923077 4.473534 0.004377 10.317557
1 CROISSANT, ADICIONAL DE PRESUNTO ADICIONAL DE MUSSARELA 0.006929 0.011274 0.005637 0.813559 72.161017 0.005559 5.303166
2 ADICIONAL DE PRESUNTO ADICIONAL DE MUSSARELA 0.007634 0.011274 0.006107 0.800000 70.958333 0.006021 4.943629
3 CROISSANT, ADICIONAL DE MUSSARELA ADICIONAL DE PRESUNTO 0.009395 0.007634 0.005637 0.600000 78.600000 0.005565 2.480916
4 CAFE COLMEIA G 200ML CROISSANT 0.017851 0.206342 0.007634 0.427632 2.072443 0.003950 1.386621

Podemos utilizar as métricas para fazermos as nossas próprias combinações de acordo com o item que queremos aumentar o nível de vendas. Por exemplo, um utem que tenha ainda um suporte baixo mas que tenha uma margem de lucro maior.

Observações finais e sugestões aos gestores

Principais descobertas

  • Houve uma divergência nos dados de vendas de itens e faturamento, causada pela falta de entrada dos dados relacionados ao recheio do croissant.
  • O estabelecimento vendeu 212 itens diferentes, com uma média de 2,79 itens por venda.
  • As vendas variaram significativamente ao longo do dia e da semana, com picos nos finais de semana e períodos noturnos.
  • Foram identificados pontos de atenção nos gráficos de vendas, como dias com vendas muito altas ou baixas, que podem precisar de análise mais aprofundada.
  • A análise do algoritmo Apriori revelou combinações de itens com alto suporte, confiança e incremento, sugerindo possíveis promoções e estratégias para aumentar as vendas de itens menos populares.

Sugestões aos gestores

  • Treinar funcionários para inserir os pedidos de forma mais detalhada, evitando a falta de dados.
  • Rever o horário de funcionamento da loja, considerando os períodos de menor movimento (primeira hora da manhã e após as 21h).
  • Implementar promoções e combos de produtos, com base nos resultados do algoritmo Apriori, para aumentar as vendas de itens menos populares, especialmente durante os horários de baixo movimento.
  • Realizar análises periódicas dos dados de vendas para identificar tendências, oportunidades e possíveis problemas operacionais.

Com base nessas descobertas e sugestões, os gestores do estabelecimento Farina in Natura podem tomar decisões informadas e eficientes para melhorar suas operações, aumentar as vendas e a satisfação dos clientes.